1. Introducción

Column {data-width= 600}

Column {data-width= 400}

Introducción

  • Problema observado:

Según Benítez (2014), “la educación permite actualizar nuestras potencialidades, desarrollar habilidades que nos permiten ser mejores. Es un derecho humano, en tanto es esencial para vivir dignamente. Es, además, un medio para la realización de otros derechos” (como se cita en Reátegui y Salas, 2019). En consecuencia, los Estados tienen la obligación de proporcionar una educación de calidad a todos sus ciudadanos; sin embargo, en el caso de América Latina, se presentan “brechas de equidad en el cumplimiento del derecho a la educación, las cuales son mayores en la secundaria alta” (López, 2019, p. 12). Aquello se ve reflejado en la tasa de deserción escolar entendido como el abandono permanente por parte del estudiante de las instituciones educativas.

En el caso de Perú, según Infobae (2023), “el Minedu expuso, en 2021, que la tasa de deserción escolar en el Perú llegó al 6,3%”; así mismo, “una encuesta del Instituto Nacional de Estadística e Informática, en ese mismo año, dejó entrever que 22 de cada 100 jóvenes entre 17 y 18 años no habían finalizado su educación secundaria”. Por ello, el presente ensayo se encargará de analizar estadísticamente la tasa de deserción en educación secundaria a nivel de provincia durante el año 2017 con el objetivo de encontrar los factores que influyen en ella. De esa manera, a raíz de los resultados de dicho análisis, el Estado peruano pueda entender el problema de fondo y así implementar eficientes políticas públicas.

Para dicho análisis se recurrirá al total de casos atendidos en la Defensoría Municipal del Niño y el Adolescente, el número de habitantes en situación de pobreza, la cantidad de hogares con acceso a Internet y el número de alumnos matriculados en el sistema educativo básico regular nivel secundario.

  • Pregunta de investigación:

¿Qué factores influyen en la tasa de deserción en educación secundaria a nivel de provincia durante el año 2017?

  • Hipótesis:

La tasa de deserción en educación secundaria a nivel de provincia durante el año 2017 se encuentra afectada por el total de casos atendidos en la Defensoría Municipal del Niño y el Adolescente, el número de habitantes en situación de pobreza, la cantidad de hogares con acceso a Internet y el número de alumnos matriculados en el sistema educativo básico regular nivel secundario.

2. Variable central

Column {data-width=600}

Histograma del porcentaje de retirados en educación secundaria - variable cuantitativa continua

Column {data-width=400}

Tabla de frecuencias

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  0.500   1.975   2.600   2.836   3.500  10.100 
  • Histograma:

En promedio, en el Perú el 2.84% de personas desertaron secundaria.En el 50% de provincias, el porcentaje de personas que desertaron secundaria varía entre 0.5 y 2.6%.

3. Correlación (VD vs VIs)

Column {data-width=750}

CASOS_DEFENSORIAMUNI

HABIT_EN_POBREZA

HOGARES_INTERNET

ALUM_MATRIC_SEC

Column {data-width=200}

Total de casos atendidos en la Defensoría Municipal del Niño y el Adolescente CASOS_DEFENSORIAMUNI

    Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
     3.0    257.2    501.5   1627.3   1195.5 100914.0 

    Spearman's rank correlation rho

data:  data$RET_SEC and data$CASOS_DEFENSORIAMUNI
S = 1407658, p-value = 0.08918
alternative hypothesis: true rho is not equal to 0
sample estimates:
      rho 
-0.121738 

Este test Spearman nos indica que la correlación entre ambas variables es estadísticamente significativa a un intervalo de confianza del 95%, dado que, el p-value (0.089) es menor a 0.5. Además, el coeficiente (-0.12) nos indica que existe una correlación inversa de magnitud pequeña entre las variables.

Pobreza total: Número de habitantes en situación de pobreza - HABIT_EN_POBREZA

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
    628    9749   21462   43692   38281 2678764 

    Spearman's rank correlation rho

data:  data$RET_SEC and data$HABIT_EN_POBREZA
S = 1039571, p-value = 0.01619
alternative hypothesis: true rho is not equal to 0
sample estimates:
      rho 
0.1715841 

Este test Spearman nos indica que la correlación entre ambas variables es estadísticamente significativa a un intervalo de confianza del 95%, dado que, el p-value (0.016) es menor a 0.5. Además, el coeficiente (0.17) nos indica que existe una correlación directa de magnitud pequeña entre las variables.

HOGARES_INTERNET

     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
      3.0     201.8     659.5   11807.1    3554.5 1171306.0 

    Spearman's rank correlation rho

data:  data$RET_SEC and data$HOGARES_INTERNET
S = 1510295, p-value = 0.004221
alternative hypothesis: true rho is not equal to 0
sample estimates:
       rho 
-0.2035277 

Este test Spearman nos indica que la correlación entre ambas variables es estadísticamente significativa a un intervalo de confianza del 95%, dado que, el p-value (0.004) es menor a 0.5. Además, el coeficiente (-0.20) nos indica que existe una correlación indirecta de magnitud pequeña entre las variables.

ALUM_MATRIC_SEC

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
    332    2632    5698   12930   10989  652542 

    Spearman's rank correlation rho

data:  data$RET_SEC and data$ALUM_MATRIC_SEC
S = 1264201, p-value = 0.9178
alternative hypothesis: true rho is not equal to 0
sample estimates:
         rho 
-0.007419689 

Este test Spearman nos indica que la correlación entre ambas variables no es estadísticamente significativa a un intervalo de confianza del 95%, dado que, el p-value (0.917) es mayor a 0.5. Además, el coeficiente (-0.007) nos indica que existe una correlación indirecta de magnitud pequeña entre las variables.

4. Regresiones

Column {data-width=500}

H1

Regresion: modelo 1
 apropiacion (I)
(Intercept) 2.865***
(0.101)
CASOS_DEFENSORIAMUNI 0.000
(0.000)
Num.Obs. 196
R2 0.010
R2 Adj. 0.004
AIC 685.9
BIC 695.8
Log.Lik. -339.971
F 1.869
RMSE 1.37
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

H2

Regresion: modelo 2
 apropiacion (II)
(Intercept) 2.853***
(0.100)
CASOS_DEFENSORIAMUNI 0.000*
(0.000)
HABIT_EN_POBREZA 0.000*
(0.000)
Num.Obs. 196
R2 0.036
R2 Adj. 0.026
AIC 682.7
BIC 695.8
Log.Lik. -337.353
F 3.567
RMSE 1.35
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

H3

Regresion: modelo 3
 apropiacion (III)
(Intercept) 2.676***
(0.117)
CASOS_DEFENSORIAMUNI 0.000
(0.000)
HABIT_EN_POBREZA 0.000***
(0.000)
HOGARES_INTERNET 0.000**
(0.000)
Num.Obs. 196
R2 0.073
R2 Adj. 0.059
AIC 676.9
BIC 693.3
Log.Lik. -333.435
F 5.074
RMSE 1.33
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

H4

Regresion: modelo 4
 apropiacion (IV)
(Intercept) 2.769***
(0.146)
CASOS_DEFENSORIAMUNI 0.000
(0.000)
HABIT_EN_POBREZA 0.000***
(0.000)
HOGARES_INTERNET 0.000
(0.000)
ALUM_MATRIC_SEC 0.000
(0.000)
Num.Obs. 196
R2 0.079
R2 Adj. 0.060
AIC 677.7
BIC 697.4
Log.Lik. -332.863
F 4.087
RMSE 1.32
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

Comparando modelos 1

Resultados de todos los modelos
 apropiacion (I)  apropiacion (II)  apropiacion (III)  apropiacion (IV)
(Intercept) 2.865*** 2.853*** 2.676*** 2.769***
(0.101) (0.100) (0.117) (0.146)
CASOS_DEFENSORIAMUNI 0.000 0.000* 0.000 0.000
(0.000) (0.000) (0.000) (0.000)
HABIT_EN_POBREZA 0.000* 0.000*** 0.000***
(0.000) (0.000) (0.000)
HOGARES_INTERNET 0.000** 0.000
(0.000) (0.000)
ALUM_MATRIC_SEC 0.000
(0.000)
Num.Obs. 196 196 196 196
R2 0.010 0.036 0.073 0.079
R2 Adj. 0.004 0.026 0.059 0.060
AIC 685.9 682.7 676.9 677.7
BIC 695.8 695.8 693.3 697.4
Log.Lik. -339.971 -337.353 -333.435 -332.863
F 1.869 3.567 5.074 4.087
RMSE 1.37 1.35 1.33 1.32
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

Comparando modelos 2

Resultados de todos los modelos
 apropiacion (I)  apropiacion (II)  apropiacion (III)  apropiacion (IV)
(Intercept) 2.865*** 2.853*** 2.676*** 2.769***
[2.667, 3.064] [2.656, 3.050] [2.446, 2.907] [2.481, 3.056]
CASOS_DEFENSORIAMUNI 0.000 0.000* 0.000 0.000
[0.000, 0.000] [0.000, 0.000] [0.000, 0.000] [0.000, 0.000]
HABIT_EN_POBREZA 0.000* 0.000*** 0.000***
[0.000, 0.000] [0.000, 0.000] [0.000, 0.000]
HOGARES_INTERNET 0.000** 0.000
[0.000, 0.000] [0.000, 0.000]
ALUM_MATRIC_SEC 0.000
[0.000, 0.000]
Num.Obs. 196 196 196 196
R2 0.010 0.036 0.073 0.079
R2 Adj. 0.004 0.026 0.059 0.060
AIC 685.9 682.7 676.9 677.7
BIC 695.8 695.8 693.3 697.4
Log.Lik. -339.971 -337.353 -333.435 -332.863
F 1.869 3.567 5.074 4.087
RMSE 1.37 1.35 1.33 1.32
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

Comparando modelos 3

Tabla ANOVA para comparar modelos
Res.Df RSS Df Sum of Sq F Pr(>F)
194 368.4607 NA NA NA NA
193 358.7476 1 9.713124 5.413781 0.0210270
192 344.6851 1 14.062537 7.838003 0.0056414
191 342.6823 1 2.002765 1.116276 0.2920562

Column {data-width=500}

H1

El % de retirados en educación secundaria responde al Total de casos atendidos en la Defensoría Municipal del Niño y el Adolescente


Call:
lm(formula = modelo1, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-2.3612 -0.8575 -0.2311  0.6439  7.2437 

Coefficients:
                       Estimate Std. Error t value Pr(>|t|)    
(Intercept)           2.865e+00  1.008e-01  28.422   <2e-16 ***
CASOS_DEFENSORIAMUNI -1.830e-05  1.338e-05  -1.367    0.173    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.378 on 194 degrees of freedom
Multiple R-squared:  0.009541,  Adjusted R-squared:  0.004435 
F-statistic: 1.869 on 1 and 194 DF,  p-value: 0.1732

H2

El % de retirados en educación secundaria responde al Total de casos atendidos en la Defensoría Municipal del Niño y el Adolescente, y al Número de habitantes en situación de pobreza


Call:
lm(formula = modelo2, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-2.3218 -0.8893 -0.2105  0.5837  7.1349 

Coefficients:
                       Estimate Std. Error t value Pr(>|t|)    
(Intercept)           2.853e+00  9.989e-02  28.558   <2e-16 ***
CASOS_DEFENSORIAMUNI -1.522e-04  6.005e-05  -2.534   0.0121 *  
HABIT_EN_POBREZA      5.277e-06  2.309e-06   2.286   0.0233 *  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.363 on 193 degrees of freedom
Multiple R-squared:  0.03565,   Adjusted R-squared:  0.02566 
F-statistic: 3.567 on 2 and 193 DF,  p-value: 0.0301

H3

El % de retirados en educación secundaria responde al Total de casos atendidos en la Defensoría Municipal del Niño y el Adolescente, al Número de habitantes en situación de pobreza y a la cantidad de Hogares con acceso a Internet


Call:
lm(formula = modelo3, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-2.1633 -0.8461 -0.2067  0.6039  7.0307 

Coefficients:
                       Estimate Std. Error t value Pr(>|t|)    
(Intercept)           2.676e+00  1.167e-01  22.942  < 2e-16 ***
CASOS_DEFENSORIAMUNI -3.907e-05  7.153e-05  -0.546  0.58561    
HABIT_EN_POBREZA      1.168e-05  3.223e-06   3.625  0.00037 ***
HOGARES_INTERNET     -2.436e-05  8.702e-06  -2.799  0.00565 ** 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.34 on 192 degrees of freedom
Multiple R-squared:  0.07345,   Adjusted R-squared:  0.05897 
F-statistic: 5.074 on 3 and 192 DF,  p-value: 0.002106

H4

El % de retirados en educación secundaria responde al Total de casos atendidos en la Defensoría Municipal del Niño y el Adolescente, al Número de habitantes en situación de pobreza, a la cantidad de Hogares con acceso a Internet y al Numero de alumnos matriculados en el sistema educativo básico regular nivel secundario


Call:
lm(formula = modelo4, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-2.2490 -0.8590 -0.2358  0.6056  6.9991 

Coefficients:
                       Estimate Std. Error t value Pr(>|t|)    
(Intercept)           2.769e+00  1.456e-01  19.012  < 2e-16 ***
CASOS_DEFENSORIAMUNI -2.468e-05  7.279e-05  -0.339 0.734963    
HABIT_EN_POBREZA      1.260e-05  3.336e-06   3.776 0.000212 ***
HOGARES_INTERNET     -1.733e-05  1.095e-05  -1.583 0.115092    
ALUM_MATRIC_SEC      -1.844e-05  1.745e-05  -1.057 0.292056    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.339 on 191 degrees of freedom
Multiple R-squared:  0.07884,   Adjusted R-squared:  0.05954 
F-statistic: 4.087 on 4 and 191 DF,  p-value: 0.00335

5. Clusters

Column {data-width=400}

PAM

AGNES

Diana

Column {data-width=600}

silhouettes de PAM

valores mal clusterizados 1

 [1] "ANDAHUAYLAS"           "ANGARAES"              "ASCOPE"               
 [4] "ATALAYA"               "BARRANCA"              "BELLAVISTA"           
 [7] "CALLAO"                "CANCHIS"               "CARABAYA"             
[10] "CARLOS F. FITZCARRALD" "CHACHAPOYAS"           "CHICLAYO"             
[13] "EL COLLAO"             "GENERAL SÁNCHEZ CERRO" "GRAN CHIMÚ"           
[16] "GRAU"                  "HUACAYBAMBA"           "HUANCAYO"             
[19] "HUARAZ"                "HUAROCHIRÍ"            "HUAURA"               
[22] "ICA"                   "JAUJA"                 "LUCANAS"              
[25] "MELGAR"                "MOHO"                  "NASCA"                
[28] "PATAZ"                 "PICOTA"                "PISCO"                
[31] "REQUENA"               "SAN MARTÍN"            "SÁNCHEZ CARRIÓN"      
[34] "SANDIA"                "TAMBOPATA"             "URUBAMBA"             
[37] "UTCUBAMBA"             "YUNGAY"               

dendograma de AGNES

silhouettes para AGNES

valores mal clusterizados 2

 [1] "AMBO"        "BOLÍVAR"     "DOS DE MAYO" "HUALLAGA"    "HUANCABAMBA"
 [6] "HUANTA"      "HUAYLAS"     "OCROS"       "PAUCARTAMBO" "SAN PABLO"  
[11] "YAROWILCA"  

dendograma de DIANA

silhouettes para DIANA

valores mal clusterizados 3

character(0)

Verificando Etiqueta para DIANA

  diana HABIT_EN_POBREZA HOGARES_INTERNET CASOS_DEFENSORIAMUNI  RET_SEC
1     1         30961.13         7659.723            1239.0292 2.143066
2     2         28330.08         1611.966             832.5172 4.493103
3     3       2678763.67      1171306.000          100914.0000 1.600000
  ALUM_MATRIC_SEC      pam   agnes
1       10795.635 2.080292 1.00000
2        6944.724 2.103448 1.37931
3      652542.000 1.000000 3.00000